234 research outputs found

    Parallelizing algorithms in ada on clementina II : Face recognition system

    Get PDF
    In the Laboratory of Research and Development on Computer Science of the National University of La Plata, a face recognition system has been developed. This article describes a series of testings based on parallel processing, with the objective of optimizing the said system response times developed in Ada programming language on SGI Origin 2000 parallel architecture known as Clementina II. Then, the results obtained are analyzedEje: Programación concurrenteRed de Universidades con Carreras en Informática (RedUNCI

    Efecto de la distribución de trabajo en aplicaciones paralelas irregulares sobre clusters heterogéneos

    Get PDF
    El objetivo de este Trabajo Final es comparar el efecto de la distribución de trabajo estática y dinámica sobre arquitecturas de cluster heterogéneo, analizando al mismo tiempo el speedup paralelo teórico y el obtenido experimentalmente para un determinado tipo de problema. En particular, se ha elegido una aplicación clásica (Parallel N-Queens) con un algoritmo de solución paralela en la que predomina el procesamiento sobre el tamaño de los datos, de modo de profundizar en los aspectos del balance de carga (estático o dinámico) sin una distorsión de los resultados producida por aspectos relacionados al uso de la memoria y/o al tamaño de los mensajes a comunicar. Para la experimentación se ha utilizado una combinación de 4 clusters interconectados, donde las máquinas dentro de cada grupo poseen procesadores homogéneos, pero diferentes entre clusters. De este modo el conjunto puede verse como un cluster heterogéneo de 43 procesadores. El problema se ha resuelto utilizando el paradigma master/worker donde el procesamiento se descompone en tareas irregulares que atentan contra el balance de carga entre los procesadores. Por esta razón se han analizado tres estrategias de distribución de trabajo calculando en cada caso el desbalance de carga y el rendimiento obtenido, comparando los resultados para determinar la que tiene mejor comportamiento, y finalmente estudiar la escalabilidad para esa solución. La solución paralela pura (sin tener en cuenta la distribución del trabajo) para el tipo de problemas donde Tp>>Tc, en particular el de N-Reinas requiere mínima comunicación entre máquinas, lo que hace esencial la elección de la distribución de datos entre los procesadores, para alcanzar un speedup cercano al óptimo (es decir un buen rendimiento).Facultad de Informátic

    Parallelizing algorithms in ada on clementina II : Face recognition system

    Get PDF
    In the Laboratory of Research and Development on Computer Science of the National University of La Plata, a face recognition system has been developed. This article describes a series of testings based on parallel processing, with the objective of optimizing the said system response times developed in Ada programming language on SGI Origin 2000 parallel architecture known as Clementina II. Then, the results obtained are analyzedEje: Programación concurrenteRed de Universidades con Carreras en Informática (RedUNCI

    Optimization of the N-body Simulation on Intel’s Architectures Based on AVX-512 Instruction Set

    Get PDF
    The N-body simulations have become a powerful tool to test the gravitational interaction among particles, ranging from a few bodies to complete galaxies. Even though N-body has already been optimized on many parallel platforms, there are hardly any studies which take advantage of the latest Intel architectures based on AVX-512 instruction set. This SIMD set was initially supported by Intel’s Xeon Phi Knights Landing (KNL) manycore processors launched at 2016. Recently, it has been included in Intel’s general-purpose processors too, starting at the Skylake (SKL) server microarchitecture and now in its successor Cascade Lake (CKL). This paper optimizes the all-pairs N-body simulation on both current Intel platforms supporting AVX-512 extensions: a Xeon Phi KNL node and a server equipped with a dual CKL processor. On the basis of a naive implementation, it is shown how the parallel implementation (can) reach, through different optimization techniques, 2355 and 2449 GFLOPS on the Xeon Phi KNL and the Xeon CKL platforms, respectively.Publicado en Communications in Computer and Information Science book series (vol. 1184).Red de Universidades con Carreras en Informátic

    Optimization of the N-body Simulation on Intel’s Architectures Based on AVX-512 Instruction Set

    Get PDF
    The N-body simulations have become a powerful tool to test the gravitational interaction among particles, ranging from a few bodies to complete galaxies. Even though N-body has already been optimized on many parallel platforms, there are hardly any studies which take advantage of the latest Intel architectures based on AVX-512 instruction set. This SIMD set was initially supported by Intel’s Xeon Phi Knights Landing (KNL) manycore processors launched at 2016. Recently, it has been included in Intel’s general-purpose processors too, starting at the Skylake (SKL) server microarchitecture and now in its successor Cascade Lake (CKL). This paper optimizes the all-pairs N-body simulation on both current Intel platforms supporting AVX-512 extensions: a Xeon Phi KNL node and a server equipped with a dual CKL processor. On the basis of a naive implementation, it is shown how the parallel implementation (can) reach, through different optimization techniques, 2355 and 2449 GFLOPS on the Xeon Phi KNL and the Xeon CKL platforms, respectively.Publicado en Communications in Computer and Information Science book series (vol. 1184).Red de Universidades con Carreras en Informátic

    Diseño de sistemas de reconocimiento de rostros

    Get PDF
    El objetivo principal del proyecto es el de llevar a cabo una investigación básica y aplicada en el campo del procesamiento digital de imágenes. Dentro del procesamiento de imágenes, encontramos sistemas de reconocimiento y clasificación que tratan con áreas como seguridad y autenticación, automatización industrial, análisis de imágenes médicas, etc. En particular, nos abocamos a observar técnicas para la detección e identificación de objetos complejos, mediante el reconocimiento basado en patrones ya conocidos, con lo cual se persigue simular la facilidad del ser humano para clasificar/seleccionar/descartar. El inconveniente de esto es que los sistemas solo proveen soluciones a problemas particulares, dependiendo del conocimiento previo con el cual se nutre en primer instancia. Dentro de este marco, nos encontramos con el estudio de los sistemas de reconocimiento de rostros, los cuales pretenden simular (como se mencionó anteriormente en general), el proceso que realiza un ser humano al observar a una persona en la vida real, tal vez reconociéndola, resultándole familiar o simplemente determinando que no la conoce. Se realiza un estudio de diferentes modelos para la detección y/o reconocimiento de rostros, tratando de no realizar una comparación, sino más bien una presentación teórica de estas técnicas. Se realiza un estudio de mayor énfasis de la técnica que más promete resultados tendientes a lo óptimo, de tal manera de reunir el conocimiento necesario, para poder realizar una implementación en un lenguaje de programación, y poder comprobar la eficiencia y eficacia de la misma, realizando un análisis de índole estadístico. Asimismo, y como resultado del análisis exhaustivo de las distintas técnicas, se obtiene como valor agregado, el estudio de un patrón de diseño de los sistemas de reconocimiento de rostros en general, capturando tanto puntos en común a nivel microsistema (es decir, distintas técnicas utilizan mismas características), como a nivel macro (es decir, distintas técnicas utilizan características distintas pero persiguiendo estas objetivos en común).Facultad de Informátic

    Diseño de sistemas de reconocimiento de rostros

    Get PDF
    El objetivo principal del proyecto es el de llevar a cabo una investigación básica y aplicada en el campo del procesamiento digital de imágenes. Dentro del procesamiento de imágenes, encontramos sistemas de reconocimiento y clasificación que tratan con áreas como seguridad y autenticación, automatización industrial, análisis de imágenes médicas, etc. En particular, nos abocamos a observar técnicas para la detección e identificación de objetos complejos, mediante el reconocimiento basado en patrones ya conocidos, con lo cual se persigue simular la facilidad del ser humano para clasificar/seleccionar/descartar. El inconveniente de esto es que los sistemas solo proveen soluciones a problemas particulares, dependiendo del conocimiento previo con el cual se nutre en primer instancia. Dentro de este marco, nos encontramos con el estudio de los sistemas de reconocimiento de rostros, los cuales pretenden simular (como se mencionó anteriormente en general), el proceso que realiza un ser humano al observar a una persona en la vida real, tal vez reconociéndola, resultándole familiar o simplemente determinando que no la conoce. Se realiza un estudio de diferentes modelos para la detección y/o reconocimiento de rostros, tratando de no realizar una comparación, sino más bien una presentación teórica de estas técnicas. Se realiza un estudio de mayor énfasis de la técnica que más promete resultados tendientes a lo óptimo, de tal manera de reunir el conocimiento necesario, para poder realizar una implementación en un lenguaje de programación, y poder comprobar la eficiencia y eficacia de la misma, realizando un análisis de índole estadístico. Asimismo, y como resultado del análisis exhaustivo de las distintas técnicas, se obtiene como valor agregado, el estudio de un patrón de diseño de los sistemas de reconocimiento de rostros en general, capturando tanto puntos en común a nivel microsistema (es decir, distintas técnicas utilizan mismas características), como a nivel macro (es decir, distintas técnicas utilizan características distintas pero persiguiendo estas objetivos en común).Facultad de Informátic

    A Hybrid Parallel Neighbor-Joining Algorithm for Phylogenetic Tree Reconstruction on a Multicore Cluster

    Get PDF
    Building phylogenetic trees is one of the significant applications within bioinformatics, mainly due to its involvement in multiple sequence alignment. Because of the high computational complexity required, the use of parallel processing during the building process is convenient. Taking into account that current cluster architectures are hybrid, in this paper we present a parallel algorithm to build phylogenetic trees based on the Neighbor-Joining method, which uses a hybrid communication model (combination of message passing and shared memory), and then analyze its performance. Finally, conclusions and possible future lines of work are presentedFacultad de Informátic

    Optimization of the N-body Simulation on Intel’s Architectures Based on AVX-512 Instruction Set

    Get PDF
    The N-body simulations have become a powerful tool to test the gravitational interaction among particles, ranging from a few bodies to complete galaxies. Even though N-body has already been optimized on many parallel platforms, there are hardly any studies which take advantage of the latest Intel architectures based on AVX-512 instruction set. This SIMD set was initially supported by Intel’s Xeon Phi Knights Landing (KNL) manycore processors launched at 2016. Recently, it has been included in Intel’s general-purpose processors too, starting at the Skylake (SKL) server microarchitecture and now in its successor Cascade Lake (CKL). This paper optimizes the all-pairs N-body simulation on both current Intel platforms supporting AVX-512 extensions: a Xeon Phi KNL node and a server equipped with a dual CKL processor. On the basis of a naive implementation, it is shown how the parallel implementation (can) reach, through different optimization techniques, 2355 and 2449 GFLOPS on the Xeon Phi KNL and the Xeon CKL platforms, respectively.Publicado en Communications in Computer and Information Science book series (vol. 1184).Red de Universidades con Carreras en Informátic

    A Hybrid Parallel Neighbor-Joining Algorithm for Phylogenetic Tree Reconstruction on a Multicore Cluster

    Get PDF
    Building phylogenetic trees is one of the significant applications within bioinformatics, mainly due to its involvement in multiple sequence alignment. Because of the high computational complexity required, the use of parallel processing during the building process is convenient. Taking into account that current cluster architectures are hybrid, in this paper we present a parallel algorithm to build phylogenetic trees based on the Neighbor-Joining method, which uses a hybrid communication model (combination of message passing and shared memory), and then analyze its performance. Finally, conclusions and possible future lines of work are presentedFacultad de Informátic
    • …
    corecore